Instalando R y Rstudio
Bienvenidos a este e-Tutorial, en el que voy a cubrir porque deberías
usar R, como instalarlo, y dar tus primeros pasos. 1
R y porqué usarlo?R es un lenguaje gratuito, libre, de código abierto, y
orientado a objetos. R no es un lenguaje de programación
como C o Java. No fue creado para el
desarrollo de software, sino que fue diseñado por estadísticos como un
entorno interactivo para el análisis de datos. El siguiente video te
cuenta en 60 segundos que es R y su historia.
La interactividad es unas de sus características más importantes, ya
que nos permitirá explorar rápidamente los datos con los que estamos
trabajando. Pero, además, dado que es un lenguaje de programación, al
igual que otros lenguajes, uno puede guardar su trabajo en
scripts que pueden ser ejecutables en cualquier
momento.
Al ser libre y de código abierto implica que cualquiera es libre de usar, redistribuir, y cambiarlo de cualquier forma. Es decir, que podemos no sólo usar las funciones que vienen en el software, sino que también crear propias, o utilizar las que otros investigadores, desarrolladores, y miembros de la comunidad idearon y pusieron a disposición en [CRAN] (http://cran.r-project.org), github, u otros lugares.
Adicionalmente, R esta extremadamente bien soportado, y
la comunidad es genial. Si tiene una pregunta puede googlearla, publicarla en StackOverflow o usar R-bloggers . Es más, los usuarios
habituales resaltan esto cuando se les pregunta como se puede ver en la
gráfica de abajo.
Si aún no está convencido, simplemente escriba “por qué usar
R” en google, y creo
que los resultados hablarán por sí mismos.
Finalmente, y no menos importante, es gratuito y siempre lo será.
RPodemos obtener una copia gratuita de R en CRAN (Comprehensive R Archive
Network) y eligiendo su sistema operativo. Los pasos para escargarlo
e instalarlo son:
El siguiente .gif ilustra los pasos para la instalación
en mi sistema operativo que es macOS, en un Mac con
procesadores Intel 64-bit.
Es importante tener en cuenta la versión de R que uno
esta instalando y utilizando. Una nueva versión principal de
R sale una vez al año y hay 2 o 3 lanzamientos menores cada
año. Por ejemplo, la version de este tutorial es
R 4.2.2 "Innocent and Trusting" lanzada 2022/10/31.
Es una buena idea actualizar R regularmente. La
actualización puede ser un poco complicada, especialmente para las
versiones principales, que requieren que reinstale todos sus paquetes,
pero posponerlo solo empeora las cosas.
Luego de descargar R, podemos trabajar al menos de dos
formas: utilizando una interfaz gráfica o trabajando en
batch mode. En este curso utilizaremos la interfaz gráfica,
pero te invito que explores el batch mode.
La distribución de R estándar viene con una interfaz
gráfica (GUI) lista para ser utilizada. Luego de instalar
R, notarás que creo un acceso directo en su escritorio.
Haciendo doble click en este podrás utilizarla.
Otra opción, y la que usaremos en el curso, es RStudio, que también es gratuito y
de código abierto. RStudio es un entorno de desarrollo
integrado, o IDE, para la programación en R. Podes pensar a
R como el motor y Rstudio como la
carrocería.
Los pasos para descargarlo e instalarlo son:
RStudio al igual que R se actualiza un par
de veces al año. Cuando haya una nueva versión disponible,
RStudiote lo hará saber. Es una buena idea actualizar
regularmente para que pueda aprovechar las últimas y mejores funciones.
El siguiente .gif ilustra los pasos para mi sistema
operativo:
R con RstudioEl siguiente paso es aprender la sintaxis de R, lo que
significa aprender sus reglas. Para contar con más herramientas de apoyo
en el uso de R trabajaremos en RStudio. Luego
de abrir Rstudio, verás cuatro ventanas junto con la barra
de opciones en la parte superior.
Brevemente, estas ventanas muestran:
Ventana 1: es el editor de scripts: se trata del
lugar donde escribimos y editamos los comandos para posteriormente
ejecutarlos. Al escribir allí no sucederá nada, a no ser que se apriete
algún botón para ejecutar los comandos o la tecla ctrl+enter.
Ventana 2: es el “entorno de trabajo” del programa: en este lugar se muestra el conjunto de datos y los ‘objetos’ (resultados, variables, gráficos, etc.) que se almacenan al ejecutar diferentes análisis.
Ventana 3: es la consola. Corresponde a lo que sería el software
R, al motor, en su versión básica. Allí el software ejecuta
las operaciones realizadas directamente desde la consola o desde el
editor de scripts.
Ventana 4 tiene varias sub pestañas:
Files permite ver el historial de archivos
trabajados con el programa;Plots permite visualizar los gráficos que se
generen;Packages permite ver los paquetes
descargados y guardados en el disco duro así como gestionar su
instalación o actualización;Help permite acceder a los manuales de ayuda
de los paquetes y las distintas funciones.Viewer muestra los resultados al construir
reportes mediante funcionalidades tipo rmarkdown.Presentation muestra los resultados de
construir presentaciones HTML5 mediante una combinación de
Markdown y R.El siguiente paso es aprender la sintaxis de R, lo que
significa aprender sus reglas. Para dar nuestros primeros pasos
trabajaremos en la ventana 3 donde se muestra la consola. Esta ventana
nos mostrará los resultados de los análisis, o cualquier mensaje
asociado con el código ingresado en la línea de comando (después de la
flecha >).
Por ejemplo, podemos comenzar usando R como calculadora,
probemos en la consola:
2 + 2[1] 4
o
log(1)[1] 0
El [1] indica que es el primer resultado del comando, y
en este caso, el único. Pero puede también ingresar algo son múltiples
valores, por ejemplo, una secuencia de enteros desde el 10 al 40:
10:40 [1] 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34
[26] 35 36 37 38 39 40
La primer línea inicia con el primer valor retornado, designado con
[1], la segunda línea comienza con el 26vo, designado con
[26].
Para salir de su sesión puede escribir simplemente o cerrar RStudio:
q()RCuando instalamos R este viene con funciones básicas,
que si bien son poderosas, sólo reflejan una pequeña fracción de lo que
es posible hacer. Es más, nos referimos a estas funciones como
base R. Las funcionalidades adicionales vienen dadas por
paquetes.
Un paquete junta código, datos, documentación y pruebas, de forma tal
que es fácil de compartir con otros. En R, uno puede
compartir código a través de estos paquetes.
Al momento de escribir este tutorial, enero de 2023, hay más de
18,975 paquetes disponibles CRAN. Esta enorme variedad de
paquetes es una de las razones por las que R tiene tanto
éxito: lo más probable es que alguien ya haya resuelto un problema en el
que estamos trabajando y por lo tanto podemos beneficiarnos de su
trabajo descargando su paquete. Por ejemplo, yo he creado dos paquetes:
RATest
e ioanalysis
En este curso utilizaremos varios paquetes, uno de los principales será tidyverse, que en realidad es una colección de paquetes R diseñados para la ciencia de datos. Todos los paquetes comparten una filosofía de diseño, gramática y estructuras de datos subyacentes.
Para instalar un paquete utilizamos la función
install.packages()
install.packages("tidyverse")En RStudio, también puede
hacerlo en la pestaña de Tools.
Una vez instalado hay que llamarlo o cargarlo con la función
library:
library(tidyverse)Una vez instalados no es necesario volverlos a instalar, pero si
cargarlos cuando vamos a utilizarlos. Recordemos, también que los
paquetes están instalados en R (el motor), y no en RStudio (la carroceria).
Finalmente, podemos ver todos los paquetes que tenemos instalados con la función:
installed.packages()A menudo utilizaremos un paquete pacman. Este paquete es
una herramienta para administrar otros paquetes de R,
especialmente reduciendo la tarea de instalar y llamar los paquetes a
utilizar.
Para ilustrar su funcionamiento, supongamos que queremos utilizar los
paquetes RATest
y tidyverse, pero no sabemos si
estan instalados en el sistema. Pacman a través de la
función p_load, se asegurara de verificar esto por
nosotros, si el paquete existe en el sistema lo llamará, y si no lo
instalará desde CRAN o desde los
repositorios en su lista.
El flujo de trabajo sería entonces:
library(pacman)
p_load(RATest, tidyverse)Podemos ver entonces que los paquetes estan instalados y cargados.
En este tutorial hicimos un breve recorrido de porqué utilizar
R, como instalarlo e instalar Rstudio. También
dimos nuestros primeros pasos en el software.
Existen muchos recursos para aprender y profundizar R, a
continuación una lista no exhaustiva:
Aplican los “disclaimers” usuales. Si tenes comentarios,
sugerencias, no dudes en enviarme un mensaje por Slack,
serán muy bienvenidos y tenidos en cuenta para la calificación final.↩︎